28.5.1 인간 피드백 기반 강화학습(RLHF)의 로봇 제어 적용

28.5.1 인간 피드백 기반 강화학습(RLHF)의 로봇 제어 적용